#!/bin/bash
# Extrae verbos de una página de conjugaciones de RAE. De producirse un
# error devuelve 1, si no 0.
# Coloca las conjugaciones en ../conjugaciones.lst.

# Variables.
error=0
archivoSalida="../conjugaciones.lst"

# Formatear en un tag por línea.
sed -i "s/></>\n</g" "$1"

# Extraer conjugaciones.
lineas=`cat "$1" | grep "class=\"conjugacion\""`

# Eliminar tags innecesarios.
# Borrar <br>.
lineas=`echo "$lineas" | sed "s/<br>/\n/g"`
# Borrar los class="conjugacion".
lineas=`echo "$lineas" | sed "s/<[^<>]*>/\n/g"`
# Borrar las /.
lineas=`echo "$lineas" | sed "s/ \/ /\n/g"`
# Borrar lo que está entre paréntesis.
lineas=`echo "$lineas" | sed "s/(.*)//g"`
# Dejar una palabra por línea.
lineas=`echo "$lineas" | sed "s/\s/\n/g"`

# Ordenar.
lineas=`echo "$lineas" | sort`

# Guardar en ../conjugaciones.lst
echo "$lineas" >> "$archivoSalida"

# TODO ¿error?
exit $error
